CNN day 1—卷基層

2024 iThome 鐵人賽

DAY 3

生成式 AI

用AI做圖像super resolution 或用AI做圖像中的物件消除系列第 3 篇

16th鐵人賽

williamchen0528

2024-09-17 23:26:31

58 瀏覽

分享至

今天是第三天，要來介紹的是卷積神經網絡（CNN)，這是一種廣泛應用在圖像處理的學習模型。它的設計靈感來自人類的視覺系統，可以有效地辨認圖像中的特徵然後進行分類。
CNN的主要組成部分包括卷積層、池化層和激活函數等。接下來，我會分成幾天來介紹這幾個是怎麼運作的～

1.卷積層（Convolutional Layer）

卷積層是CNN的核心。它通過一種叫做「卷積操作」的方法來得到輸入圖像中的局部特徵。卷積操作的過程可以簡單想成使用一個小矩陣，也就是所謂的「卷積核（Kernel）」，在圖像上滑動。
這個卷積核每次覆蓋圖像的一小塊區域，進行點積運算，就可以產生一個新的值。當整個圖像經過這個滑動運算後，就會形成一個「特徵圖（Feature Map）」。

卷積核的大小一般來說是3x3或 5x5的矩陣。
卷積核的參數（也就是權重）在訓練過程中不斷調整，用來適應不同的特徵，因此可以捕捉圖像中的紋理、邊緣、角點等重要的信息。
透過調整「步長（Stride）」和「填充（Padding）」，可以控制特徵圖的尺寸，使得網絡適應不同的輸入圖像。

明天要介紹的是激活函數！敬請期待！